Análise Taxa de Desemprego Alemanha

Nesta seção, são apresentados os resultados da análise da taxa de desemprego mensal na Alemanha, no período de 1994 a 2016. Como os dados estão expressos em porcentagem, foi necessário convertê-los para proporções, dividindo os valores por 100. A série contém um total de 272 observações, obtidas por meio do sistema de gerenciamento de séries temporais do Banco Central do Brasil.

Abaixo temos uma descritiva dos valores da série e também seu Box-plot, podemos notar que não há presença de outliers.

summary(serie_desemprego)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 0.04300 0.06625 0.08200 0.07887 0.09375 0.11200

A Figura a seguir exibe a série temporal da taxa de desemprego mensal na Alemanha no período de 1994 a 2016. Verifica-se uma tendência de aumento na taxa de desemprego entre 2002 e 2005, atingindo seu pico nesse intervalo. A partir de 2006, observa-se um movimento de queda contínua, o qual se mantém até o término do período analisado, indicando uma possível recuperação sustentada do mercado de trabalho alemão.

Por conseguinte, temos a decomposição da série para tedência e sazonalidade:

A avaliação da estacionariedade da série foi conduzida por meio de testes de raiz unitária, conforme apresentado na Tabela 1. Os testes de Augmented Dickey-Fuller (ADF) e Phillips-Perron (PP) não rejeitaram a hipótese nula de presença de tendência estocástica (p-valores de 0.5579 e 0.9630, respectivamente), sugerindo que a série possui raiz unitária. No entanto, o teste KPSS para nível, cuja hipótese nula é de estacionariedade em torno de uma média constante, foi rejeitado (p-valor = 0.0100), corroborando a evidência de não estacionariedade. Esse conjunto de resultados indica a presença de uma tendência estocástica na série.

A Tabela 2 apresenta os resultados dos testes para identificação de tendência determinística. Todos os testes aplicados (Cox-Stuart, Cox and Stuart Trend, Mann-Kendall, Mann-Kendall Trend e KPSS para tendência) rejeitaram a hipótese nula de ausência de tendência (p-valores ≤ 0.01), indicando de forma consistente a presença de uma tendência determinística ao longo do tempo.

Por fim, a Tabela 3 resume os resultados dos testes de sazonalidade. O teste de Kruskal-Wallis não rejeitou a hipótese nula de ausência de sazonalidade (p-valor = 1.0000), enquanto o teste de Friedman detectou evidência de sazonalidade significativa (p-valor = 0.0181). Assim, embora haja alguma indicação de componente sazonal, os resultados são inconclusivos e sugerem que, se presente, a sazonalidade não é fortemente expressiva.

Tabela 1: Resultados testes de raiz unitária
Testes H0 p_valor Conclusao
Augmented Dickey-Fuller Tendencia 0.5579 Tendencia
Phillips-Perron Unit Root Tendencia 0.9630 Tendencia
KPSS Test for Level NAO tendencia 0.0100 Tendencia
Tabela 2: Resultados teste de tendência determinística
Testes H0 p_valor Conclusao
Cox Stuart NAO tendencia 0.00 Tendencia
Cox and Stuart Trend NAO tendencia 0.00 Tendencia
Mann-Kendall Trend NAO tendencia 0.00 Tendencia
Mann-Kendall NAO tendencia 0.00 Tendencia
KPSS Test for Trend NAO tendencia 0.01 Tendencia
Tabela 3: Resultados teste de sazonalidade
Testes H0 p_valor Conclusao
Kruskall Wallis NAO Sazonal 1.0000 NAO Sazonal
Friedman rank NAO Sazonal 0.0181 Sazonal

Ajuste do Modelo

Para investigar a presença de dependência de longo prazo na série temporal da taxa de desemprego, estimou-se o expoente de Hurst por diferentes métodos. Conforme apresentado, a estimativa simples baseada no método R/S (rescaled range) resultou em um valor de 0.8373, enquanto a versão corrigida apresentou um valor ainda mais elevado, de 0.9856. Já o expoente de Hurst empírico foi estimado em 0.8267, com a versão corrigida indicando 0.7992. Todos os valores obtidos são significativamente superiores a 0,5, o que evidencia forte persistência temporal na série. Isso implica que choques passados tendem a ter efeitos prolongados ao longo do tempo, o que é característico de processos com memória longa.

Adicionalmente, foi estimado o parâmetro de diferenciação fracionária d , com valor de 1.1003, indicando que a série é fracamente não estacionária e apresenta memória longa, uma vez que \(0.5<d<1.5\). As estimativas do desvio padrão associado, obtidas via aproximação assintótica e via regressão, foram de 0.2102 e 0.1232, respectivamente, reforçando a robustez da estimação de d.

Esses resultados sugerem que, para a modelagem adequada da série, é necessário considerar abordagens que capturem a estrutura de longa dependência, como modelos ARFIMA.

## Simple R/S Hurst estimation:         0.8372923 
## Corrected R over S Hurst exponent:   0.9855974 
## Empirical Hurst exponent:            0.8267286 
## Corrected empirical Hurst exponent:  0.799164 
## Theoretical Hurst exponent:          0.5538539
## $d
## [1] 1.100285
## 
## $sd.as
## [1] 0.2102335
## 
## $sd.reg
## [1] 0.1231577

Por fim, foi considerado um modelo ARFIMA(2, 1, 0), ou seja, dois coeficientes autoregressivos e uma diferenciação. Sendo os valores estimados dos parâmetros significativos, a 5% são: \(\phi_{1}=0.48, \phi_{2}=0.45, \text{fractional differencing}=-0.26\). Além disso temos, \(\text{AIC}=-3775.07, \text{BIC}=-3757.3\). Vale ressaltar que um valor negativo para fractional differencing não é o mais adequado.

Análise de resíduos e Previsão

A Figura apresenta os diagnósticos dos resíduos do modelo ajustado. O gráfico superior exibe a série dos resíduos ao longo do tempo, os quais oscilam em torno de zero sem apresentar padrões sistemáticos visíveis, sugerindo ausência de estrutura temporal remanescente. A análise da função de autocorrelação (ACF), apresentada no gráfico inferior esquerdo, demonstra que os resíduos não apresentam autocorrelação significativa até a defasagem 25, uma vez que a maioria dos coeficientes está contida dentro dos limites de confiança. A normalidade dos resíduos foi avaliada por meio do histograma com sobreposição de uma curva de densidade normal (gráfico inferior direito). A distribuição dos resíduos aproxima-se de uma distribuição normal, com leve assimetria, porém sem evidências visuais de desvios em escala.

Por fim, foi realizado o teste de Ljung-Box para avaliar a independência dos resíduos. O valor do estatístico \(Q∗=9,5962\) com 10 graus de liberdade resultou em um p-valor de 0,4766. Dessa forma, não se rejeita a hipótese nula de ausência de autocorrelação nos resíduos até a defasagem 10, indicando que os resíduos podem ser considerados independentes ao longo do tempo.

forecast::checkresiduals(resid$Mode1)

## 
##  Ljung-Box test
## 
## data:  Residuals
## Q* = 9.5962, df = 10, p-value = 0.4766
## 
## Model df: 0.   Total lags used: 10

Nas imagens abaixo temos acf e pacf dos resíduos do modelo ajustado.

Por fim, a Figura abaixo apresenta os valores preditos para os próximos 12 períodos, com base no modelo ajustado à série temporal. A linha em cinza representa a previsão pontual (Exact prediction), enquanto as faixas tracejadas indicam os intervalos de predição com 95% de confiança. O intervalo tracejado em vermelho corresponde ao intervalo de predição exato (Exact 95% PI), enquanto o intervalo tracejado em laranja refere-se ao intervalo assintótico (Limiting 95% PI), o qual se alarga com o aumento do horizonte de previsão, refletindo o crescimento da incerteza associada às estimativas futuras.

Análise Preço do Ouro

O ouro é um ativo financeiro para exportação, investimentos de longo prazo, consumo industrial e câmbio de moedas estrangeiras. Segundo The Gold Bullion Company, o Brasil ocupa o 7° lugar no balanço mundial de oferta e demanda de ouro, com este contexto foi feito uma análise da série histórica do preço de comercialização diária do ouro(em quilogramas) entre os anos de 2013 a 2023. O Dataset utilizado pode ser acesso neste link do Kaggle Gold Price Prediction. Os dados foram agrupados mensalmente, e ao todo temos 120 observações, o que representaria 120 meses.

summary(serie_gold_price)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1069    1244    1321    1440    1711    1972

A Figura a seguir apresenta a série temporal dos preços mensais do ouro no período de 2013 a 2023. A partir de uma análise visual preliminar, não se observa evidência clara de sazonalidade na série. Destaca-se, entretanto, um aumento expressivo nos preços entre os anos de 2019 e 2021.

Temos também a decomposição da série para tendência e sazonalidade na Figura abaixo:

Conforme os resultados apresentados na Tabela 1, os testes de raiz unitária indicam a presença de uma tendência estocástica na série. Tanto o teste de Augmented Dickey-Fuller (ADF) quanto o teste de Phillips-Perron não rejeitam a hipótese nula de presença de raiz unitária (p-valores de 0.3553 e 0.5252, respectivamente), sugerindo que a série não é estacionária. Por outro lado, o teste KPSS rejeita a hipótese nula de estacionariedade em torno de uma média constante (p-valor = 0.0100), reforçando a conclusão de não estacionariedade e indicando a presença de uma tendência. A Tabela 2 apresenta os resultados dos testes para identificação de tendência determinística. Todos os testes aplicados, incluindo Cox-Stuart, Mann-Kendall e KPSS para tendência, rejeitaram a hipótese nula de ausência de tendência com p-valores inferiores a 0.01. Esse conjunto de evidências confirma a existência de uma tendência determinística significativa ao longo do tempo, o que é compatível com a trajetória ascendente observada na série, especialmente a partir de 2019.

A análise de sazonalidade, sumarizada na Tabela 3, foi conduzida por meio dos testes de Kruskal-Wallis e Friedman rank. Em ambos os casos, os p-valores elevados (0.9991 e 0.8554, respectivamente) indicam que não há evidência estatística para rejeitar a hipótese nula de ausência de sazonalidade. Assim, conclui-se que a série não apresenta comportamento sazonal recorrente. Em conjunto, os resultados apontam que a série é não estacionária, possui uma tendência determinística significativa e não apresenta componentes sazonais, o que deve ser considerado na escolha e especificação de modelos de previsão adequados.

Tabela 1: Resultados testes de raiz unitária
Testes H0 p_valor Conclusao
Augmented Dickey-Fuller Tendencia 0.3553 Tendencia
Phillips-Perron Unit Root Tendencia 0.5252 Tendencia
KPSS Test for Level NAO tendencia 0.0100 Tendencia
Tabela 2: Resultados teste de tendência determinística
Testes H0 p_valor Conclusao
Cox Stuart NAO tendencia 0.00 Tendencia
Cox and Stuart Trend NAO tendencia 0.00 Tendencia
Mann-Kendall Trend NAO tendencia 0.00 Tendencia
Mann-Kendall NAO tendencia 0.00 Tendencia
KPSS Test for Trend NAO tendencia 0.01 Tendencia
Tabela 3: Resultados teste de sazonalidade
Testes H0 p_valor Conclusao
Kruskall Wallis NAO Sazonal 0.9991 NAO Sazonal
Friedman rank NAO Sazonal 0.8554 NAO Sazonal

Modelo ARMA

O primeiro modelo ajustado foi ARMA(1,1), ou seja, temo uma estrutura ARMA com um coeficiente autoregressivo e um coeficiente médias móveis estimados, em que ambos foram significativos, sendo seus valores \(\phi_{1}=0.98\) e \(\theta_{1}=0.29\)

fit_netar <- forecast::nnetar(serie_gold_train)

fit_netar_fc <- forecast::forecast(fit_netar, h = 12)

accuracy(fit_netar_fc, serie_gold_test)[,c(1:3,5)]
##                       ME     RMSE      MAE     MAPE
## Training set -0.06223462 38.63102 29.95781 2.189456
## Test set      4.54790956 86.70522 73.13056 4.049764
checkresiduals(fit_netar$residuals)

## 
##  Ljung-Box test
## 
## data:  Residuals
## Q* = 18.152, df = 22, p-value = 0.6969
## 
## Model df: 0.   Total lags used: 22
plot(fit_netar_fc)

test_forecast(actual = serie_gold_price,
              forecast.obj = fit_netar_fc,
              test = serie_gold_test)